class: center, middle, inverse, title-slide .title[ #
] .author[ ### ] --- class: animated, fadeIn # Outline #### **1. Motivación** #### **2. Muestreo** #### **3. Distribuciones de probabilidad** - Tipos - Como medir las distribuciones <style> .title-slide { background-image: url('img/1.png'); background-size: 100%; } </style> --- layout: false class: left, bottom, inverse, animated, bounceInDown # 01 ## Motivación --- class: animated, fadeIn # Motivación .pull-left[ <img src="img/muestreo0.png"> ] --- class: animated, fadeIn # Motivación .pull-left[ <img src="img/muestreo1.png"> ] --- class: animated, fadeIn # Motivación .pull-left[ <img src="img/muestreo1.png"> ] .pull-right[ **Inferencia**: - Identificar las **reglas** que siguen los datos - Ajustar un modelo o **distribución** a los datos - Extraer conclusiones sobre la **realidad** - Las distribuciones son importantes para los **test estadísticos** ] --- class: animated, fadeIn # Motivación .pull-left[ <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-1-1.png" width="360" /> **Modelo estadístico** $$ peso = dieta + residuos $$ - `\(dieta\)`: promedio de los grupos - `\(residuos\)`: siguen una distribución estadística ] .pull-right[ **Pregunta**: hay diferencia en el peso en ratones control *vs.* con una dieta alta en grasas? **Problema**: la diferencia en las medias puede deberse al azar: - Sólo tenemos una muestra de ratones en cada muestra - Hay variación en los pesos Saber las reglas de la aleatoriedad/variación nos dirá cuán probable es que estas diferencias se deban al azar. ] --- class: animated, fadeIn # Motivación .pull-left[ <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-2-1.png" width="360" /> **Modelo estadístico** $$ peso = dieta + residuos $$ - `\(dieta\)`: promedio de los grupos - `\(residuos\)`: siguen una distribución estadística (no siempre siguen una distribución Gaussiana...) ] .pull-right[ **Pregunta**: hay diferencia en el peso en ratones control *vs.* con una dieta alta en grasas? **Problema**: la diferencia en las medias puede deberse al azar: - Sólo tenemos una muestra de ratones en cada muestra - Hay variación en los pesos Saber las reglas de la aleatoriedad/variación nos dirá cuán probable es que estas diferencias se deban al azar. ] --- class: animated, fadeIn # Motivación <center> <img src="img/balanza.png" width=80%> --- layout: false class: left, bottom, inverse, animated, bounceInDown # 02 ## Muestreo --- class: animated, fadeIn # Muestreo (*sampling*) Estimar la fracción de ranas verde claro. <center> <img src="img/ranas.png" width=65%> </center> -- - **Muestra**: eventos seleccionados de manera aleatoria e independiente de las poblaciones de interés - **Población**: la población o proceso que es de tu interés --- class: animated, fadeIn # Muestreo (*sampling*) Estimar la fracción de ranas verde claro. <center> <img src="img/ranas2.png" width=65%> </center> - **Aleatorización**: se espera que la muestra represente bien a la población/realidad, pero no está garantizado --- class: animated, fadeIn # Muestreo (*sampling*) Estimar la fracción de ranas verde claro. <center> <img src="img/ranas3.png" width=65%> </center> - **Aleatorización**: se espera que la muestra represente bien a la población/realidad, pero no está garantizado --- class: animated, fadeIn # Muestreo (*sampling*) Estimar la fracción de ranas verde claro. <center> <img src="img/ranas3.png" width=65%> </center> - **Independencia**: las observaciones no dependen las unas de las otras --- class: animated, fadeIn # Muestreo (*sampling*) Estimar la fracción de ranas verde claro. <center> <img src="img/ranas3.png" width=65%> </center> - **Tamaño de muestra**: número de observaciones en tu muestra - **Distribución**: reglas que siguen los valores aleatorios --- layout: false class: left, bottom, inverse, animated, bounceInDown # 03 ## Distribuciones de probabilidad --- class: animated, fadeIn ## Qué es una distribución de probabilidad? .pull-left[ - Asigna probabilidades a los posibles resultados de un experimento - Reglas de aleatorización ] --- class: animated, fadeIn ## Qué es una distribución de probabilidad? .pull-left[ - Asigna probabilidades a los posibles resultados de un experimento - Reglas de aleatorización **Por ejemplo**: - Número de ranas verde clarito en 10 capturas - Fracción real: 1/3 - Hay 11 posibles resultados: 0, 1, ... 10 Resultados posibles:<br> <img src="img/ranas4.png" width=80%> ] -- .pull-right[ <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-3-1.png" width="360" style="display: block; margin: auto;" /> ] --- class: animated, fadeIn ## Qué es una distribución de probabilidad? .pull-left[ - Asigna probabilidades a los posibles resultados de un experimento - Reglas de aleatorización **Por ejemplo**: - Número de ranas verde clarito en 10 capturas - Fracción real: 1/3 - Hay 11 posibles resultados: 0, 1, ... 10 Resultados posibles:<br> <img src="img/ranas4.png" width=80%> ] .pull-right[ <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-4-1.png" width="360" style="display: block; margin: auto;" /> ] --- class: animated, fadeIn ## Tipos de distribuciones de probabilidad .pull-left[ **Discreta**: observaciones que sólo pueden tomar números enteros (por ejemplo, contajes) Función de masa de probabilidad: - Probabilidad de que la variable tome un valor específico. - La probabilidad de que tome un valor intermedio es 0. <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-5-1.png" width="324" style="display: block; margin: auto;" /> ] -- .pull-right[ **Continua**: observaciones que toman números continuos (por ejemplo: tamaño de las ranas, en cm) Función de densidad de probabilidad (FDP): - Se define mediante parámetros como la media y la varianza - Valores infinitos en el eje `x` - La probabilidad de que la variable tome un valor exacto es 0; en cambio, se calcula la probabilidad de que esté dentro de un intervalo, mediante el área bajo la curva de la FDP. ] --- class: animated, fadeIn ## Tipos de distribuciones de probabilidad .pull-left[ **Continua**: observaciones que toman números continuos (por ejemplo: tamaño de las ranas, en cm) Función de densidad de probabilidad (FDP): - Se define mediante parámetros como la media y la varianza - Valores infinitos en el eje `x` - La probabilidad de que la variable tome un valor exacto es 0; en cambio, se calcula la probabilidad de que esté dentro de un intervalo, mediante el área bajo la curva de la FDP. - La suma area bajo la curva (AUC) es 1 ] .pull-right[ <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-6-1.png" width="360" style="display: block; margin: auto;" /> ] --- class: animated, fadeIn ## Distribución de muestreo - Los datos pueden seguir patrones definidos por una distribución teórica - Al tratarse de un muestreo, siempre hay un componente de aleatoriedad <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-7-1.png" width="360" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Preguntas ### Pregunta 1 **¿Cuáles de las siguientes afirmaciones son verdaderas?** 1. Las probabilidades en una distribución estadística suman 1. 2. Una distribución de probabilidad asigna probabilidades a los posibles resultados de un experimento. 3. Si los experimentos no son aleatorizados, los resultados no siguen una distribución estadística. --- class: animated, fadeIn ## Preguntas ### Pregunta 1 **¿Cuáles de las siguientes afirmaciones son verdaderas?** 1. Las probabilidades en una distribución estadística suman 1. ✔️ 2. Una distribución de probabilidad asigna probabilidades a los posibles resultados de un experimento. ✔️ 3. Si los experimentos no son aleatorizados, los resultados no siguen una distribución estadística.❌ --- class: animated, fadeIn ## Preguntas ### Pregunta 2 **¿Cuál es la probabilidad de obtener un resultado de \(X = 1.5\) en una distribución discreta?** 1. 0.15 2. 0 3. 1 --- class: animated, fadeIn ## Preguntas ### Pregunta 2 **¿Cuál es la probabilidad de obtener un resultado de \(X = 1.5\) en una distribución discreta?** 1. 0.15 ❌ 2. 0 ✔️ 3. 1 ❌ En distribuciones discretas, solo los valores exactos que pertenecen al conjunto discreto tienen probabilidad > 0. --- class: animated, fadeIn ## Visión global de distribuciones Existe una gran variedad de distribuciones en las que pueden caer las variables. Las principales son: - **Binomial**: número de éxitos en una serie de ensayos. - **Poisson**: probabilidad de que ocurra un número dado de eventos en un intervalo fijo de tiempo o espacio. - **Gaussiana (normal)**: distribución continua con forma de campana, caracterizada por su media y desviación estándar. <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-8-1.png" width="576" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Como medir las distribuciones Las distribuciones se pueden describrir con parámetros clásicos de estadística descriptiva: .pull-left[ - Media - Moda - Mediana - Rango ] .pull-right[ - Varianza - Desviación estándard - Rango de cuantiles - Asimetría - Curtosis ] --- class: animated, fadeIn ### Asimetría **Describe la simetría y la longitud relativa de las colas de una distribución.** - Asimetría positiva (skew positivo): la cola derecha es más larga que la izquierda. - Asimetría nula (skew = 0): distribución simétrica. - Asimetría negativa (skew negativo): la cola izquierda es más larga que la derecha. <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-9-1.png" width="576" style="display: block; margin: auto;" /> --- class: animated, fadeIn ### Curtosis **Describe la aplanamiento o longitud de las colas de una distribución.** - Curtosis positiva: distribución de colas cortas, también llamada leptocúrtica. - Curtosis = 0: representación base de una distribución dada, también llamada mesocúrtica. - Curtosis negativa: distribución de colas largas, también llamada platicúrtica. <img src="data:image/png;base64,#4.ProbRmd_files/figure-html/unnamed-chunk-10-1.png" width="576" style="display: block; margin: auto;" /> --- class: animated, fadeIn ## Contacto <div style="margin-top: 20vh; text-align:center;"> | Marta Coronado Zamora | David Castellano | |:-:|:-:| | <a href="mailto:marta.coronado@uab.cat"><i class="fa fa-paper-plane fa-fw"></i> marta.coronado@uab.cat</a> | <a href="mailto:david.castellano@uab.cat"><i class="fa fa-paper-plane fa-fw"></i> david.castellano@uab.cat</a> | | <a href="https://bsky.app/profile/geneticament.bsky.social"><i class="fab fa-bluesky fa-fw"></i> @geneticament.bsky.social</a> | <a href="https://bsky.app/profile/castellanoed.bsky.social"><i class="fab fa-bluesky fa-fw"></i> @castellanoed.bsky.social</a> | | <a href="https://www.uab.cat"><i class="fa fa-map-marker fa-fw"></i> Universitat Autònoma de Barcelona</a> | <a href="https://gutengroup.mcb.arizona.edu/"> <i class="fa fa-map-marker fa-fw"></i> University of Arizona</a> | --- layout: false class: left, bottom, inverse, animated, bounceInDown ### Créditos #### Adaptado de: CSDA tutorial - Probability distributions (EMBL, Sarah Kaspar, PhD), Erik Kusch (Aarhus University)